Septembre 2019
Big data : opportunités, stockage et analyse des mégadonnées
Big data : une synthèse de ce qu'il faut savoir pour comprendre les notions essentielles et utiliser les...
RECHERCHEZ parmi plus de 10 000 articles de référence ou pratiques et 4 000 articles d'actualité
PAR DOMAINE D'EXPERTISE
PAR SECTEUR INDUSTRIEL
PAR MOTS-CLES
NAVIGUER DANS LA
CARTOGRAPHIE INTERACTIVE
DÉCOUVREZ toute l'actualité, la veille technologique GRATUITE, les études de cas et les événements de chaque secteur de l'industrie.
L’objet de cet article est de cerner le terme Big Data ou mégadonnées ainsi que les technologies et enjeux qui lui sont associées. Dans un premier temps, les mégadonnées sont caractérisées et des usages sont évoqués pour différents domaines. Ensuite, sont présentées les différentes solutions de stockage des mégadonnées, des bases de données SQL et NoSQL à l’informatique dans le nuage. La deuxième partie est consacrée à l’analyse et la fouille des mégadonnées, notamment sous le prisme des dernières avancées de l’apprentissage machine et de l’intelligence artificielle.
Le Web est devenu une source d’information incontournable grâce à la quantité et à la diversité des contenus textuels porteurs d’opinions générés par les internautes. Ces contenus sont multiples : blogs, commentaires, forums, réseaux sociaux, etc. Devant cette abondance de données, le développement d’outils pour extraire, synthétiser et comparer les opinions exprimées sur un sujet donné devient crucial. Cet article dresse un panorama des principales approches en analyse automatique d’opinions. Trois questions fondamentales sont abordées : comment reconnaître les portions de textes qui renseignent l’utilisateur sur l’opinion qu’il recherche ? Comment évaluer la polarité des opinions qui en ressortent ? Comment présenter le résultat de manière pertinente à l’utilisateur ?
Dans le contexte d’essor des big datas, la Datavisualisation est un outil au service de la médiation homme-données. En fournissant un accès aux données, elle constitue un outil de communication, d’explication et d’exploration de données, avec des applications dans de nombreux domaines professionnels et scientifiques. De même, avec internet, elle s’étend à d’autres sources d’informations, pas ou peu appréhendés jusqu’ici. Le défi de la datavisualisation est de fournir un cadre méthodologique et des techniques pour analyser rapidement des données hétérogènes de plus en plus nombreuses, afin de faire émerger des connaissances nouvelles et signifiantes dans le contexte d’utilisation. Cet article présente la discipline pour une compréhension des enjeux, des objectifs et des méthodes couverts par la datavisualisation.
Le veilleur fait face aujourd’hui à des contenus de plus en plus longs. Mais le temps dont il dispose pour traiter cette masse d’information ne s’adapte pas à cette prolifération. Pouvoir résumer du contenu permet d’identifier et de sélectionner rapidement celui qui est qualifié.
Cependant, cette action ne doit pas se baser uniquement sur un modèle de calcul statistique car ce dernier ne permettra pas d’obtenir des résultats pertinents. Essential Summarizer de Mining Essential est le seul outil français qui permet de réaliser des résumés automatiques sur la base d’un traitement sémantique. Sa version gratuite permet de tester l’outil avant de passer à une version professionnelle.
Cet article décrit toutes les étapes nécessaires pour réaliser un résumé automatique pertinent en prenant en compte le domaine traité (Agriculture, Sciences, Industrie, etc.), la langue et le support de diffusion utilisé (Site Web, Document office, PDF).
Essential Summarizer permet de traiter 20 langues dans 27 domaines.
La simple mise à disposition de la connaissance, sans traitement particulier, rend cette dernière floue et inexploitable. Noopsis, outil de collecte développé par une entreprise normande, permet de collecter un grand volume d’information et interprète le sens grâce à son moteur de traitement sémantique. Il permet également de réaliser un premier traitement de l’information collectée avant que celle-ci ne soit analysée par le veilleur.
Cette fiche répondra à ces questions à travers des exemples.
Le recueil des nombreuses informations proposées par les bases de données scientifiques nécessite de s’appuyer sur des outils permettant l’analyse automatique de ces informations. La majorité des bases de données commerciales offrent un format de téléchargement qui structure l’information (même format pour toutes les références).
A partir de celui-ci, on peut combiner l’ensemble des données présentes dans les différents champs documentaires et créer des listes, des réseaux, des matrices. Cette information élaborée permettra de répondre aux questions « qui fait quoi », « où », « comment », « quand », « avec qui » et ainsi de définir de nouvelles orientations scientifiques, d’implémenter les processus d’innovation, de trouver des partenariats, de réaliser le « benchmarking » d’auteurs et d’institutions, etc.
Compte tenu du nombre croissant d’informations accessibles, cette méthode de travail est la seule qui permette d’avoir en un minimum de temps une information pertinente et stratégique sur un sujet donné.
TECHNIQUES DE L'INGENIEUR
L'EXPERTISE TECHNIQUE ET SCIENTIFIQUE
DE RÉFÉRENCE
Avec Techniques de l'Ingénieur, retrouvez tous les articles scientifiques et techniques : base de données, veille technologique, documentation et expertise technique
Plus de 10 000 articles de référence, fiches pratiques et articles interactifs validés par les comités scientifiques
Toute l'actualité, la veille technologique, les études de cas et les événements de chaque secteur de l'industrie
Automatique - Robotique | Biomédical - Pharma | Construction et travaux publics | Électronique - Photonique | Énergies | Environnement - Sécurité | Génie industriel | Ingénierie des transports | Innovation | Matériaux | Mécanique | Mesures - Analyses | Procédés chimie - bio - agro | Sciences fondamentales | Technologies de l'information
ACCUEIL | A PROPOS | ANNUAIRE AUTEURS | EXPERTS SCIENTIFIQUES | PUBLICITÉ | PLAN DU SITE | MENTIONS LÉGALES | RGPD | COOKIES | AIDE & FAQ | CONTACT
PAIEMENT
SÉCURISÉ
OUVERTURE RAPIDE
DE VOS DROITS
ASSISTANCE TÉLÉPHONIQUE
+33 (0)1 53 35 20 20